阅读更多
过去16年,Google使用一个中心化源码控制系统去管理一个日益庞大的单一共享源码库。它的代码库包含了约10亿个文件(有重复文件和分支)和 3500万行注解,86TB数据,900万唯一源文件中含有大约20亿行代码。2014年,Google的2.5万名程序员每周修改25万个文件中的 1500万行代码。相比之下,Linux内核源码库有4万文件和1500万行代码。Google的程序员每个工作日递交1.6万次commits,还有 2.4万commits是自动系统完成的。代码库每天响应了数十亿次文件读取请求,高峰时每秒需要执行80万次查询,工作日平均每秒需要执行50万次查 询。在2012年10月前,这个库只支持Linux,之后加入了Windows和Mac支持。2012年前人类递交的commits占多数,但之后 Google切换到了定制的源码控制实现,自动的 commits开始增加。《ACM通讯》刊登了一篇文章描述了Google为什么将数十亿行代码储存在单一的源码库

来自:solidot奇客  
来自: Solidot
0
4
评论 共 1 条 请登录后发表评论
1 楼 daiyumixi8 2016-07-04 13:48
[b][i][u]
引用
[list]
[*][img][url][flash=200,200][*][*]
[/flash][/url][/img] [/list]
[/u][/i][/b]

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • 【点评】为何Google将数十亿代码存储在一个单一的仓库中?

    本文译文转载自《软件工程研究与实践》,由江贺(大连理工大学)、印莹(东北大学)、康雁(云南大学)翻译,张昱(中国科学技术大学)审核,吴穹博士在译文基础上做了进一步的审校点评:下面这篇文...

  • 为何Google将几十亿行源代码放在一个仓库?

    【AI科技大本营导读】与大多数开发者的想象不同,Google只有一个代码仓库——全公司使用不同语言编写的超过10亿文件,近百TB源代码都存放在自行开发的版本管理系统Piper中,只当项目开源且需要外部协作时,才会使用...

  • 基于LangChain+LLM的本地知识库问答:从企业单文档问答到批量文档问答

    1 什么是LangChain及langchain的整体组成架构 2 解读langchain-ChatGLM项目的关键源码,不只是把它当做一个工具使用,因为对工具的原理更了解,则对工具的使用更顺畅 3 langchain-ChatGLM项目的升级版langchain-...

  • Alibaba Code代码索引技术实践:为Code Review提供本地IDE的阅读体验

    答案是统一的结构在这里同样用一个Java实例(User.java)来简化说明,将其转换成AST之后如下图所示,感兴趣的可以移步ASTExplorer自行测试。截图信息有限,本章节中我们只需要关注一个信息,通过AST可以拿到代码中...

  • 【翻译】Google在构建静态代码分析工具方面的经验教训

    软件bug耗费开发者和软件公司大量的时间和金钱。 以2014年为例,被广泛使用的SSL协议实现中的一个(“goto fail”)bug导致可接受无效的SSL证书,另外一个与日期格...

  • 搭建自己的以图搜图系统 (一):10 行代码以图搜图

    本文将介绍如何快速搭建自己的图片搜索引擎,只要 10 行 Python 代码就能轻松搞定!

  • Google 和 Facebook 为什么不 用Docker?

    点击上方“芋道源码”,选择“设为星标”管她前浪,还是后浪?能浪的浪,才是好浪!每天 8:55 更新文章,每天掉亿点点头发...源码精品专栏原创 | Java 2020 超神之路,很肝~中...

  • [阿里DIN] 深度兴趣网络源码分析 之 整体代码结构

    Deep Interest Network(DIN)是阿里妈妈精准定向检索及基础算法团队在2017年6月提出的。其针对电子商务领域(e-commerce industry)的CTR预估,重点在于充分利用/挖掘...本文为系列第三篇,将分析DIN源码整体思路。

  • 从实现原理谈谈低代码

    点击上方“朱小厮的博客”,选择“设为星标”后台回复"书",获取后台...这些年调研过了几乎所有市面上的相关技术和产品,发现虽然每家产品细节都不太一样,但在底层技术上却只有少数几种方案,因此我们认为不同产品...

  • 太可怕了!有些码农为啥写代码,写到监狱里去了?

    两万字长文揭露心酸真实经历》的文,收到很多朋友反馈,说码农行业犯罪,有时完全是无意识的,根本不清楚自己的行为是否为违法犯罪。今天鱼哥给大家梳理出近年来码农被抓的一些案例,希望大家能从中有收获。鱼哥同时...

  • 现在大火的低代码是怎么回事?从实现原理谈谈低代码

    但在底层技术上却只有少数几种方案,因此我们认为不同产品间的最大区别是实现原理,了解这些实现原理就能知道各个低代码平台的优缺点,所以本文将会介绍目前已知的各种低代码实现方案,从实现原理角度看低代码。...

  • Google和Facebook为什么不用Docker?

    “ 写作本文的起因是我想让修改后的分布式 PyTorch 程序能更快的在 Facebook 的集群上启动。探索过程很有趣,也展示了工业机器学习需要的知识体系。图片来自 Pexels2007...

  • 代码托管从业者 Git 指南

    做过基于 Git 支持 SVN 客户端接入、Git 代码托管平台分布式、Git 代码托管读写分离、Git 代码托管高可用等工作,所幸学到了一些知识,积累了一些经验,本次分享我的一点经验之谈,希望对即将进入或者已在代码托管...

  • 如何编写更高层次嵌入式C代码?

    如何编写更高层次嵌入式C代码?1. 简介2. C语言特性2.1处处都是陷阱2.1.1 无心之过2.1.2 数组下标2.1.3 容易被忽略的break关键字2.1.4 意想不到的八进制2.1.5 指针加减运算2.1.6 关键字sizeof2.1.7 增量运算符’++’...

  • 2018年排名Top 100的Java类库——在分析了277,975份源码之后得出的结论

    这就是为什么我们在2018年的图表中查看了一些不太受欢迎的类库,并在2019年对它们进行跟踪,如: #85 org.objectweb.asm – A simple API for decomposing, modifying, and recomposing binary Java classes #86 ...

  • 数据仓库漫谈之前世今生

    数据中心:就是把散落在组织各个地方的数集起来统一存储、分发、应用。 运营分析系统:是在数据中心的基础之上,根据业务需要做一些运营分析报表,直接服务于各个业务部门。 数据平台:这个概念更大,在数据中心的...

  • 安装NumPy教程-详细版

    附件是安装NumPy教程_详细版,文件绿色安全,请大家放心下载,仅供交流学习使用,无任何商业目的!

  • 语音端点检测及其在Matlab中的实现.zip

    语音端点检测及其在Matlab中的实现.zip

  • C#文档打印程序Demo

    使用C#完成一般文档的打印,带有页眉,页脚文档打印,表格打印,打印预览等

Global site tag (gtag.js) - Google Analytics